Explainability has been widely stated as a cornerstone of the responsible and trustworthy use of machine learning models. With the ubiquitous use of Deep Neural Network (DNN) models expanding to risk-sensitive and safety-critical domains, many methods have been proposed to explain the decisions of these models. Recent years have also seen concerted efforts that have shown how such explanations can be distorted (attacked) by minor input perturbations. While there have been many surveys that review explainability methods themselves, there has been no effort hitherto to assimilate the different methods and metrics proposed to study the robustness of explanations of DNN models. In this work, we present a comprehensive survey of methods that study, understand, attack, and defend explanations of DNN models. We also present a detailed review of different metrics used to evaluate explanation methods, as well as describe attributional attack and defense methods. We conclude with lessons and take-aways for the community towards ensuring robust explanations of DNN model predictions.
translated by 谷歌翻译
我们介绍了遮阳板,一个新的像素注释的新数据集和一个基准套件,用于在以自我为中心的视频中分割手和活动对象。遮阳板注释Epic-kitchens的视频,其中带有当前视频分割数据集中未遇到的新挑战。具体而言,我们需要确保像素级注释作为对象经历变革性相互作用的短期和长期一致性,例如洋葱被剥皮,切成丁和煮熟 - 我们旨在获得果皮,洋葱块,斩波板,刀,锅以及表演手的准确像素级注释。遮阳板引入了一条注释管道,以零件为ai驱动,以进行可伸缩性和质量。总共,我们公开发布257个对象类的272K手册语义面具,990万个插值密集口罩,67K手动关系,涵盖36小时的179个未修剪视频。除了注释外,我们还引入了视频对象细分,互动理解和长期推理方面的三个挑战。有关数据,代码和排行榜:http://epic-kitchens.github.io/visor
translated by 谷歌翻译
拟议的购物助理模型SANIP将帮助盲人检测手持有的物体,并从检测到的对象中获取信息的视频反馈。提出的模型由三个Python模型组成,即自定义对象检测,文本检测和条形码检测。为了检测手持对象,我们创建了自己的自定义数据集,该数据集包括Parle-G,Tide和Lays等日常商品。除此之外,我们还收集了购物车和出口标志的图像,因为对于任何人来说,使用购物车都至关重要,并且在紧急情况下还要注意出口标志。对于其他2个模型,提出的文本和条形码信息将从文本转换为语音,并传达给盲人。该模型用于检测经过训练并成功地检测和识别所需输出的对象,其精度和精确度良好。
translated by 谷歌翻译
从自然语言监督中学习视觉表示,最近在许多开创性的作品中表现出了巨大的希望。通常,这些具有语言的视觉模型表现出对各种数据集和任务的强大可传递性。但是,由于缺乏易于使用的评估工具包和公共基准,评估这些模型的可转让性仍然很具有挑战性。为了解决这个问题,我们构建了高级版(评估语言的视觉任务级传输),这是用于评估(预训练)语言增强视觉模型的第一个基准和工具包。升华由三个组成部分组成。 (i)数据集。作为下游评估套件,它由20个图像分类数据集和35个对象检测数据集组成,每个数据集都用外部知识来增强。 (ii)工具包。开发了自动高参数调谐工具包,以促进下游任务的模型评估。 (iii)指标。多种评估指标用于测量样品效率(零射击和少量)和参数效率(线性探测和完整模型微调)。我们在https://computer-vision-in-the-wild.github.io/elevater/上公开发布leverater
translated by 谷歌翻译
流量交叉点的机芯特定车辆分类和计数是各种交通管理活动的重要组成部分。在这种情况下,在最近基于计算机视觉的技术方面的进步,相机已经成为从交通场景中提取车辆轨迹的可靠数据源。然而,随着这种方式的运动轨迹的特性根据相机校准而变化,对这些轨迹进行分类非常具有挑战性。虽然一些现有方法已经解决了具有体面准确性的此类分类任务,但这些方法的性能显着依赖于手动规范的几个感兴趣区域。在这项研究中,我们提出了一种自动分类方法,用于移动基于Vision的车辆轨迹的特定分类(例如右转,左转和通过运动)。我们的分类框架使用此后,采用基于同性的分配策略来指定在交通场景中观察到的不同运动模式,以将传入的车辆轨迹分配给识别的移动组。旨在克服基于视觉轨迹的固有缺点的新的相似度措施。实验结果表明,拟议的分类方法的有效性及其适应不同交通方案的能力,无需任何手动干预。
translated by 谷歌翻译
在本文中,正在研究精神任务 - 根脑 - 计算机接口(BCI)的分类,因为这些系统是BCI中的主要调查领域,因为这些系统可以增强具有严重残疾人的人们的生命。 BCI模型的性能主要取决于通过多个通道获得的特征向量的大小。在心理任务分类的情况下,培训样本的可用性最小。通常,特征选择用于通过摆脱无关紧要和多余的功能来增加心理任务分类的比率。本文提出了一种为精神任务分类选择相关和非冗余频谱特征的方法。这可以通过使用四个非常已知的多变量特征选择方法VIZ,BHATTACHARYA的距离,散射矩阵的比率,线性回归和最小冗余和最大相关性。这项工作还涉及对心理任务分类的多元和单变量特征选择的比较分析。在应用上述方法后,研究结果表明了精神任务分类的学习模型的性能的大量改进。此外,通过执行稳健的排名算法和弗里德曼的统计测试来认识所提出的方法的功效,以找到最佳组合并比较功率谱密度和特征选择方法的不同组合。
translated by 谷歌翻译
病理学涉及通过分析人体标本发现疾病的原因的做法。在该领域中最常用的方法,是使用组织学,其基本上是研究和观察细胞和组织中的微观结构。被广泛使用,并转换成数字形式的滑动观看方法来产生高分辨率图像。这使得深学习和机器学习深潜的面积为医学科学这个领域。在本研究中,一个基于神经网络已经提出了血细胞图像的分类成各种类别。当输入图像是通过所提出的架构通过和所有超参数和降比率值是按照提出的算法,那么模型进行分类的血液与图像的95.24%的准确度使用。提出的模型的性能比现有的标准体系结构及工作由不同的研究人员做的更好。因此,模型将使病理系统,这将减少对实验室男人人为错误和日常负荷的发展。反过来,这将帮助病理学家在更有效地开展工作。
translated by 谷歌翻译
癫痫是在4000年全球出现回来的最常见的神经系统疾病之一。这几天它会影响大约5000万人的人。这种疾病的特征是复发癫痫发作。在过去的几十年里,可用于癫痫发作控制的治疗方法已经提高了很多关于医学技术领域的进步。脑电图(EEG)是一种广泛使用的技术,用于监测大脑活动,广泛流行的癫痫发作区域检测。它在手术前进行,并且还在在神经刺激装置中可用的时间操作预测癫痫发作。但在大多数情况下,视觉检查是通过神经病学家进行的,以检测和分类疾病的模式,但这需要大量的域名知识和经验。这一切依次对神经外部产生压力,并导致时间浪费,并降低了他们的准确性和效率。需要一些在信息技术领域的自动化系统,例如在深度学习中使用神经网络,可以帮助神经根学家。在本文中,提出了一种模型,可提供98.33%的准确性,可用于开发自动化系统。发达的系统将显着帮助神经科学家的表现。
translated by 谷歌翻译
及时诊断对于拯救癫痫患者的寿命非常重要。在过去的几年里,癫痫有很多治疗方法。这些治疗需要使用抗癫痫药物,但在控制癫痫发作频率方面无效。需要使用手术去除受影响的区域。脑电图(EEG)是一种广泛使用的技术,用于监测大脑活动,广泛流行的癫痫发作区域检测。它在手术前使用,以定位受影响区域。使用EEG图表的手动过程是耗时,需要深入的专业知识。在本文中,已经提出了一种模型,其保留了文本一维向量的形式的EEG信号的真实性质。拟议的模型实现了Bonn大学数据集的艺术表现状态,分别为所有五类脑电图数据分类,分别为平均灵敏度,特异性为81%和81.4%。同样对于二进制分类,特异性和敏感性的99.9%,比分数为99.5%,而不是其他研究人员使用的2D模型。因此,开发系统将显着帮助神经外科,从而提高其性能。
translated by 谷歌翻译
句子排序是指将一组句子重新安排为适当的连贯顺序的任务。对于此任务,大多数以前的方法都使用序列生成技术探索了基于全局上下文的端到端方法。在本文中,我们提出了一组强大的本地和全球基于上下文的成对订购策略,利用我们的预测策略在该领域的所有以前的作品都优于该策略。我们提出的编码方法利用该段的丰富的全局上下文信息使用新型变压器体系结构来预测成对顺序。对两种建议的解码策略的分析有助于更好地解释成对模型中的错误传播。这种方法是最准确的纯对成对模型,我们的编码策略还显着提高了使用成对模型的其他最新方法的性能,包括先前的最新技术,证明了这项工作的研究新颖性和普遍性。此外,我们还展示了阿尔伯特的预训练任务如何有助于其显着胜过BERT,尽管参数较小。与先前的最新艺术相比,广泛的实验结果,建筑分析和消融研究表明,所提出的模型的有效性和优越性,除了对成对模型的功能有更好的了解。
translated by 谷歌翻译